查看原文
其他

多重线性回归假设条件(三)

章画 SPSS学堂 2022-04-26

作者:章画  审核:X  封面:自己想吧

01

多重共线性


        当我们用两个或两个以上的自变量进行多重回归来预测因变量取值的时候,如果既希望提高拟合优度,又希望保持回归方程的显著性,那么必须符合这样一种隐含的「假设」:各自变量之间是相互独立的。如果自变量之间存在线性相关关系,则意味着自变量之间的取值可以线性地相互决定,当我们用这个自变量预测了因变量的取值之后,另一个自变量对于决定因变量的取值已经没有独立的意义了,不会再对这种预测有显著的贡献,因而导致单个回归参数显著性的降低.回归理论中,把自变量之间的线性相关性称为多重共线性。

       实际问题中,自变量之间完全相关或完全不相关的情况都是很少见的。我们应当尽量避免在回归模型中加入高度相关的自变量。



02

多重共线性诊断方法


       由于多重共线性是一种样本现象,而来源于现实生活中的样本数据又各有其领域和背景, 所以数学上无法找到一个统一的诊断标准。这里可以提供一些经验的诊断规则。由这些规则所做出的个别诊断并不一定是绝对正确的,实际问题中应当结合分析人员的专业知识相互参照着运用。

容许度

       容许度=1-Rj^2。其中的R是第j个自变量与其余变量进行回归时的判定系数。容许度越接近1,表示多重共线性越弱。


膨胀因子(VIF)

        膨胀因子:膨胀因子是容许度的倒数。膨胀因子越接近1(膨胀因子理论最小值是1),表示解释变量之间的多重共线性越弱,通常膨胀因子<10是弱多重共线性。若膨胀因子>=10,说明膨胀因子存在严重多重共线性。



03

多重共线性诊断案例分析


        现有一份学生身体测试数据集。将学生的身高、体重、胸围作为自变量来对因变量肺呼量进行多重线性回归拟合。来学习本文的重点多重共线性诊断。

        选择「分析」-「回归」-「线性」。弹出如下线性回归窗口

        打开统计对话窗口,勾选共线性诊断

      我们建立了3个有统计学意义的多元线性回归拟合模型,根据R^2最大最优原选择了模型3.模型3拟合度是56.5%。接下来我们根据模型3来做多重线性诊断性分析


      按照一般的诊断规则,容许度和VIF(膨胀因子)这些值的大小(图中红框所示)来看,表明模型中不存在很严重的多重共线性问题。

 

扫描下方二维码,回复20180604,可获得本次案例哦~

欢迎添加数据分析服务微信号LYJ_312和社群助手微信号spss_shequn


您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存